Pour s'autocorriger, les LLM ont-ils besoin d'un compagnon ? | Silicon

Clément Bohic - Silicon - 22/11

Des chercheurs proposent d'améliorer les capacités d'autocorrection des LLM par une méthode de backtracking fondée sur un modèle auxiliaire.

Pour améliorer les capacités d’autocorrection des LLM, le retour sur trace (backtracking) peut-il être une alternative à l’apprentissage par renforcement ? Des chercheurs de l’université de Cambridge et de Google Research se sont penchés sur le sujet.

À la racine de leur démarche, une étude démontrant que les mécanismes d’autocorrection des erreurs de logique ou de raisonnement a tendance à dégrader la qualité des réponses des LLM.

La solution proposée repose sur un modèle auxiliaire « léger » de type classifieur. Celui-ci détecte les erreurs dans les traces et alimente le LLM en conséquence, sans modification des poids (il indique en l’occurrence l’emplacement des erreurs)...
[Courte citation de 8% de l'article original]

Tags : llm - chatgpt - data & stockage - deep learning - machine learning -

Source et Copyright images et textes : Clément Bohic - Silicon
Lien original, consulter l'article dans son intégralité ici : https://www.silicon.fr/llm-autocorrection-473636.html
Lien direct sur notre site : http://www.newsexplorer.fr/article/17369526/Pour-s%27autocorriger--les-LLM-ont-ils-besoin-d%27un-compagnon---|-Silicon
Partager : Facebook - Twitter

Avis de non-responsabilité pour les articles et les traductions :
Les articles publiés sur ce site ont été rédigés par des auteurs externes et ne représentent pas l'avis ou les opinions de ce site. Les informations contenues dans ces articles sont fournies à titre indicatif et ne doivent pas être considérées comme des conseils professionnels ou juridiques.
De plus, les traductions proposées sur ce site peuvent ne pas être exactes ou complètes. Nous ne pouvons garantir l'exactitude, la fiabilité ou la pertinence de ces traductions et nous déclinons toute responsabilité pour toute perte ou préjudice causé par leur utilisation.
Nous recommandons à nos lecteurs de vérifier toutes les informations avant de prendre des décisions ou d'entreprendre des actions en se basant sur ces articles ou traductions. Nous ne serons pas tenus responsables des erreurs ou des omissions dans les informations fournies sur ce site.